查看原文
其他

当金融更智能,你的数据隐私更安全还是更危险?

CF40研究部宥朗 中国金融四十人论坛 2020-01-09

你是否会经常收到各种烦人的垃圾短信,例如某个楼盘即将开售,某个商场大搞促销,又或者某个贷款软件利息惊人?

是的,你的个人数据被泄露了。

信息社会,数据带来巨大价值的同时也带来了用户隐私保护方面的难题。随着大数据的深度应用,网络安全问题日渐严峻,个人信息泄露不断增多,公民的数据隐私与安全正在遭受严重威胁。

犹记2018年,华住集团旗下多个连锁酒店开房信息数据在网上标价出售,数据涉及1.3亿人的个人信息及开房记录。

2019年,央视3•15晚会曝光一款名为“社保掌上通”的APP,当用户查询个人社保信息时,用户的信息已被发送至一家大数据公司的服务器。

智能时代的加速到来,更加剧了人们对于数据隐私泄露的担忧。

此前一款名为“ZAO”的软件再次引发热议。利用AI技术,“ZAO”能够将视频素材中的主角头像替换成用户上传的照片,做出仿真度非常高的“换脸”视频输出。


图源 / 网络

然而,“ZAO”软件的“霸王条款”获得了用户的隐私信息,包括手机号码、人脸信息等,具有巨大的潜在数据安全隐患。假如有人滥用“ZAO”的AI换脸技术进行信息弄虚作假,人脸识别技术又无法辨识真伪,个人隐私信息、财产等可能被盗,甚至被用于违法犯罪,后果不堪设想……

智能时代,数据隐私与安全是否荡然无存?

推动数据立法:
任重道远而又迫在眉睫

事实上,面对频发的隐私泄露事件,各国都在加强对数据安全和隐私的保护。

2018年5月,欧盟宣布实施《通用数据保护条例》(GDPR),规定用户可以要求经营者删除其个人数据并且停止利用其数据进行建模,而违背该条例的企业将会面临巨额罚款。

在GDPR正式实施一个月后,美国加利福尼亚州颁布了《2018年加州消费者隐私法案》(CCPA),加强消费者隐私权和数据安全保护。

2019年5月28日,我国国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,提出了收集重要数据的备案制以及向第三方提供重要数据的批准制的新要求。

但是,推动数据立法还任重道远。

在日前由中国金融四十人论坛(CF40)主办的第三届金家岭财富管理论坛上发布的《2019中国智能金融发展报告》(以下简称《报告》)指出:在新技术的背景下,新兴法律关系不断涌现,新型权利诉求也日新月异,相应纠纷也日渐增多,迫切需要新的法律规定来明确权利义务、调整法律关系、回应社会关切。


《报告》特别强调,数据安全和隐私保护中一个不容忽视的事实是,金融数据中包含了更多的用户敏感信息。

一方面,金融行业的信息化建设起步较早,行业内拥有大量涉及用户个人信息的累积数据,数据隐私保护亟需关注;另一方面,以银行、保险、证券公司为代表的金融业,其主要业务全部基于大规模数据展开,数据安全保护愈加关键。

但是,我国现行的金融制度却无法满足当下金融监管的需求,特别是在数据信息使用和数据安全方面的立法。

“加强对大型金融科技公司的监管迫在眉睫。”CF40资深研究员、中国证监会原主席、《报告》负责人肖钢对此问题表示,“需要从完善监管框架,加强对金融消费者和投资者的保护。”


其中一个重要方面,就是加强对金融消费者和投资者的保护,出台相关法规,加强约束,从数据保护隐私明确数据归属权和私有权的管理。

“现在相关的法律法规欠缺,数据你可以用,但归属权是谁的,只能被哪个机构来使用是缺乏规范的。要防止大型公司恶意收集、存储、交易、滥用用户数据,从投资者保护的角度进一步落实投资者管理,做好风险揭示,妥善处理投资者的投诉。”肖钢强调。

就此问题,《报告》建议:出台智能金融隐私保护、数据安全、责任主体认定、投资者保护以及道德伦理方面的规范性文件,条件成熟时逐步上升至法律法规。

“数据保护”与“数据孤岛”是否两难

由于世界各国都在加强对数据安全和隐私的保护,重视数据安全和隐私已经成为了世界性的趋势。

基于用户隐私保护,机构间简单的数据交换在包括欧盟《通用数据保护条例》和我国的《中华人民共和国网络安全法》等国内外政策法规框架中是不被允许的。

用户是原始数据的拥有者,在用户没有批准的情况下,公司不能交换数据。其次,对于数据建模使用的目的,用户具有知情权,未经允许也不可以改变。所以,过去的许多数据交换的尝试,例如数据交易所,也存在合规问题。

然而,基于这些考虑因素,金融行业中的海量数据往往分散在不同的机构、不同部门,是割裂的“小数据”,形成了一个个大大小小的“数据孤岛”。

另一方面,商业公司中尤其是金融机构,其所拥有的数据往往都有巨大的潜在价值。机构间、部门间基于商业利益考量,也不会把数据进行交换与聚合。由此,即使在同一个公司内,数据也往往以“孤岛”形式出现。对某一家机构而言,可利用的大数据,尤其是真实有效的标注数据数量有限。

但实践经验显示,在金融风控实践中,往往需要联合多家企业的数据来打造更好的信用模型。在人工智能领域,数据建模也需要把各方数据整合到一处进行统一处理,从而为用户提供更好的金融服务。

问题在于,可有一个两全办法能够破解“数据孤岛”与“数据保护”的矛盾困境?

《报告》就此问题分析指出,保护数据隐私最主要的做法是对涉及个人隐私的大数据进行“匿名化”处理,而最早被广泛认同的此类技术是k-匿名模型。GDPR鼓励公司尽最大努力对存储的数据进行匿名化处理。同样,参与数据收集和存储的各方通过及时了解最新的隐私保护技术,如差分隐私,也可有助于减少基于数据关联性的攻击。

此外,安全多方计算也为数据隐私保护提供了技术保障。金融公司为了共同的利益,需要在保护数据私密性的前提下,把各方的数据进行合并运算并得出分析结果。

《报告》提出,综合考虑以上因素,“联邦学习”是一种针对数据孤岛和数据隐私的两难困境的可行解决方案。

事实上,无论是中国人工智能开源软件发展联盟(AIOSS)发布的国内首个团体联邦学习标准,还是IEEE联邦学习标准项目的持续推进,都传递出相同的信号——联邦学习正逐步成为人工智能领域破解数据隐私保护难题的关键性、先导性技术。

“联邦学习”何方神圣?

“联邦学习”指的是在满足隐私保护和数据安全的前提下,设计一个机器学习框架,使各个机构在不交换数据的情况下进行协作,提升机器学习的效果。

其核心就是解决数据孤岛和数据隐私保护的问题,通过建立一个数据“联邦”,让参与各方都获益,推动技术整体持续进步。

联邦学习的应用场景十分广泛,并没有特别的领域或者具体算法限制。因此,大部分机器学习、深度学习中的常见算法,经过一定改造均可适配到联邦学习中来。

“联邦学习”作用几何?

《报告》分析提出,联邦学习作为一种能够保障数据隐私、数据合法合规利用前提下,充分利用多方数据的建模方法,在智能金融领域拥有巨大的应用前景。

目前,联邦学习已经开始了在行业领域的落地探索,在不同行业有多样化的应用场景和落地形态。

金融领域,联邦学习已应用于风控、反洗钱等多种场景。提升金融机构间与金融行业与其他行业机构间的合作。

小微企业贷款风控场景中,为积极响应国家政策,扶持小微企业融资贷款,有贷款资质的互联网金融平台、小贷公司、银行等可以通过联邦学习在本地对数据进行建模,由参与的机构共享最终的风控和预测模型,进行贷款发放。在此过程中,参与机构的数据不出本地,数据不对外输出,以此提升预测能力,共享模型效果。

联合反洗钱场景中,银行和保险等金融机构在本地对数据进行建模,使用联邦学习,各个机构的模型联合起来,能打破数据之间的壁垒,提高反洗钱系统的准确度和审查人员的效率,解决该领域样本少,数据质量低问题。

“联邦学习”如何工作?


《报告》分析指出,联邦学习的实现策略是:建立一个虚拟的共有模型。这个虚拟模型类似于把数据聚合在一起建立的最优模型,但是在建立虚拟模型的时候,数据本身不移动,因此不泄露隐私,符合数据合规要求,建好的模型也仅在各自的区域为本地的目标服务。在这样一个联邦机制下,各个参与者的身份和地位相同,实现“共同富裕”。

具体来看,联邦学习具有五大特征:

❶ 各方数据都保留在本地,不泄露隐私也不违反法规;

❷ 多个参与者联合数据建立虚拟的共有模型,实现各自的使用目的、共同获益;

❸ 在联邦学习的体系下,各个参与者的身份和地位相同;

❹ 结果模型的性能充分逼近理想模型(即全部数据都传输给单一方所得到的模型);

❺ “联邦”就是数据联盟,不同的联邦有着不同的运算框架,服务于不同的运算目的。如金融行业和医疗行业就会形成不同的联盟。

总的来说,联邦学习是保障金融行业安全的关键核心技术。借助联邦学习来训练联合模型,每个银行和金融机构的各自数据不需对外输出,只需要做一些参数上面的交换,由此“数据孤岛”与“数据安全”问题也就双双迎刃而解。

用“小数据”就能实现“大智能”,联邦学习可谓高明。


CF40“智能金融发展报告”项目

  

中国金融四十人论坛开展的“智能金融发展报告”项目由肖钢牵头,课题组由来自政府监管部门、金融监管部门及20余家知名金融机构、科技研究机构、科技公司的研究骨干组成。

课题对国内外智能金融领域的发展动态、技术创新、产业政策、应用趋势、风险评估、监管配套等进行全面梳理和评估,形成年度《中国智能金融发展报告》,每年发布更新。

2020年6月,《2019中国智能金融发展报告》将在华盛顿发布英文版。

CF40《2019中国智能金融发展报告》

课题组

  

注:本课题人员以个人名义参加此项研究,所表达观点不代表所在机构观点。





责编:宥朗视觉:李盼 东子 
监制卜海森 李俊虎

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存